424 research outputs found

    Interpretabilidade de modelos aplicados aos dados do Enem.

    Get PDF
    Introdução O desenvolvimento de novas tecnologias nos ultimos anos, tanto de hardware quanto de software, viabilizou a aplicacão de técnicas mais sofisticadas de modelagem, como as de aprendizado de maquina. Focadas principalmente em aumentar o poder preditivo, essas técnicas muitas vezes se baseiam em abordagens não paramétricas e não lineares, que resultam em modelos mais precisos e menos interpretaveis [3]. E diante desse cenário que a interpretabilidade de um modelo pode se tornar um fator tão importante quanto a precisao de suas predições [2]. Por esta razão, metodologias como Shap Values foram desenvolvidas para apresentar relações entre as variáveis preditivas e a variável resposta, que muitas vezes nao são tão evidentes. Assim, o objetivo deste trabalho e elencar quais são as informações mais relevantes para um modelo aplicado aos dados socioeconomicos do Exame Nacional do Ensino Médio (Enem), bem como identificar como elas impactam o seu funcionamento atraves dos Shap Values

    Uso de Modelos de Decomposicão em Componentes Não Observáveis para predição de séries temporais não estacionárias de commodities agrícolas.

    Get PDF
    A predição de séries temporais é frequentemente feita por Modelos Autoregressivos de Médias Móveis (ARMA, Autoregressive Moving Average em inglês) sendo a principal desvantagem desses modelos o requisito de que as séries temporais estudadas sejam estacionárias, o que frequentemente nao ocorre [1]. Para contornar esse problema, geralmente são feitos processos de diferenciacão de dados, que podem ser feitos diretamente no conjunto de dados ao se calcular a diferença do valor da variável no passo t com o valor do passo anterior t − 1 [4], ou configurando os modelos para diferenciar sucessivamente a série analisada até ela se tornar estacionária, como no caso dos Modelos Autorregressivos Integrados de Médias Móveis (ARIMA, Autoregressive Integrated Moving Average, em inglês) e suas variações [3]. Apesar da possibilidade de diferenciação, os resultados dos modelos ARIMA continuam sendo sensíveis a dados perturbados e que não se desenvolvem ao redor de uma média constante [3]. Diante disso, os Modelos de Decomposico em Componentes Não Observáveis (UCM, Unobserved Component Model, em Inglês) surgem como uma alternativa promissora a esses modelos por não assumirem estacionariedade dos dados, além disso, os modelos UCM podem ser compreendidos em componentes de tendência, ciclo e perturbação, o que os torna especialmente úteis para analisar séries que possuem ciclo, como é o caso das culturas agrícolas [1]. Diante disso, o objetivo desse estudo foi comparar o desempenho de Modelos de Decomposição em Componentes Não Observáveis com o desempenho de Modelos Autoregressivos de Médias Móveis para a predição

    Aprendizado de máquina aplicado à predição do preço do arroz utilizando dados climatológicos e econômicos

    Get PDF
    Introdução O arroz e um dos cereais mais importantes do mundo, com produção mundial superior a 780 milhoes de toneladas e consumo por metade da população mundial. A produção brasileira é estimada em 12 milhões de toneladas, o que coloca o Brasil como o único país nao asiático a estar entre os 10 maiores produtores, e 70% da produção se concentra no Rio Grande do Sul [3]. Como em todo cultivo agrícola, o custo de produção do arroz é dependente de insumos, como área plantada, fertilizantes, defensivos, diesel, entre outros, e é afetada por fatores climáticos, tais como precipitação, insolação e temperatura. A oscilação no preço dos insumos e variações climáticas podem, portanto, impactar a produção, a oferta e, consequentemente, o preço do arroz, causando problemas econômicos e sociais importantes, como redução do poder de compra dos consumidores ou redução da renda no campo. Desta forma, possibilitar melhor previsão da variação de preço do arroz pode trazer benefícios sociais e econômicos ao permitir melhor planejamento dos envolvidos. Diversos pesquisadores ja usaram modelos computacionais de aprendizagem de máquina distintos para tentar prever o preço de commodities. Geralmente esses estudos usam o historico de preços disponíveis no mercado financeiro além de outros dados de interesse que possam justificar a oscilação do preço [2]. O objetivo desse estudo foi testar diferentes modelos computacionais classicos de aprendizagem de máquina, amplamente utilizados em estudos de previsão de preço, para prever o preço do arroz no Rio Grande do Sul usando o histórico do preço desta commoditie, assim como no histórico de dados climáticos da região, como temperatura e precipitação, e de insumos necessários, como área de plantio, producão, estoque inicial, e custo de adubos, calcário e diesel
    corecore